Alineando LLMs en tareas complejas de final abierto mediante entrenamiento incremental basado en rúbricas Optimiza la alineación de los aprendizajes en tareas complejas y abiertas a través de un entrenamiento incremental basado en rúbricas. 2025-11-09 · 2 min